查看原文
其他

万字综述绘制植物单细胞测序的蓝图! | 单细胞专题

市场部-LS 联川生物 2024-03-27



高通量单细胞RNA测序(scRNA-Seq)在植物研究中有着巨大潜力。这其中涉及到植物原生质体制备的细节,如何优化制备方法,平衡细胞数量和测序深度等,以使得测序效果达到最佳,通过这些环节的学习可以帮助研究者了解scRNA-Seq如何更好地应用于植物研究。来自德国图宾根大学植物分子学中心的Marja C.P. Timmermans课题组在Trends in Plant Science(IF=18.313)发表综述,讨论了如何最大限度地优化植物中的scRNA-Seq方法。联川生物为您带来全文翻译。



摘要

基于液滴的单细胞RNA测序技术(scRNA-Seq)已经从一项极具潜力的技术迅速发展成为一种适用于解决更广泛生物学问题的方法。事实证明,scRNA-Seq提供的详细信息在解决植物发育和环境应激反应的方面有着强大的应用潜力。

然而,为了最大限度地发挥这项技术的潜力,需要考虑一系列scRNA-Seq上游的实验和下游的分析要点。其中最主要的是细胞解离方法的优化,除此以外,了解生物/非生物的应激反应,以及平衡细胞数量和测序深度也是至关重要的。作者在这里讨论这些因素并提供实用建议,以完善植物单细胞实验设计,并确保最佳的实验结果。

scRNA-Seq的新兴力量

在高通量scRNA-Seq的分辨率下观察细胞间异质性,为植物生物学中的一系列关键问题打开了一个全新的视角。细胞如何跨越不同的发育状态,组织在创伤后如何再生,应激反应如何发生,还有遗传变异如何影响这些过程,scRNA-Seq均能够解释这些问题。

在方法学中,基于液滴的scRNA-Seq允许并行分析数千个细胞,利用微流体通道和精确的压力来产生油包水,在这些液滴中可以对单个细胞的mRNA群体进行逆转录(RT)。除了固有技术的些微差别之外,这项技术的特别巧妙之处在于通过独特的分子标识符(UMI)对单个细胞和细胞内的单个转录本进行独特的标记,这种标记可以降低文库制备中PCR扩增所产生的误差。从2015年首次提出的灵活且复杂的微流控系统开始,现在的scRNA-Seq有了更加标准化的商业选择,虽然它们很难定制化,但提供了更大程度的简便性。

早期的植物单细胞研究主要集中在拟南芥(Arabiopsis Thaliana)的初级根尖。得益于拟南芥具有丰富而详细的空间和时间转录信息以及组织和发育阶段特异的标记基因,可以用于单细胞数据分析。此外,植物根很适合用于描绘发育转变,因为它具有严格的时空组织,相同类型细胞围绕中心柱排列成同心圆,研究者可以沿着纵轴捕捉根的发育状态。这些研究表明,scRNA-Seq在检测稀有细胞类型/状态和解决复杂组织中的发育轨迹方面具有非凡的能力。随后的研究应用这项技术来研究拟南芥、玉米(Zea Mays)、水稻(Oryza Sativa)和番茄(Solanum Lycopersicum)等物种的气孔、叶片维管系统、茎尖、花序和侧根原基的发育(表1)。这些早期的研究主要涉及到分化过程、组织特异性非生物应激反应、细胞类型特异性遗传、生物应激反应、不同细胞类型对遗传扰动的特异性反应和细胞周期调节器的动态变化等方面提供了独特的见解。从而对在植物中使用这项技术的优点进行了强有力的检验(表1)。

表1 植物scRNA-Seq研究现状

 

    虽然这些早期研究激发了人们对将scRNA-Seq应用于植物的遐想,但这项技术也突显了实验设计和数据分析的挑战。其中主要的问题是如何保证解离的植物细胞的可用性,如何处理细胞解离过程中产生的背景干扰,如何去降低或去除这种背景下的生物/非生物应激反应,以及如何识别“cluster" 对应的完整细胞信息。有许多优秀的综述详细介绍了一些先进的实验技术和数据分析方法,包括植物研究领域。然而,在植物组织上进行单细胞测序实验还可能会面临一些新的技术挑战。作者对Rich-Griffin等人的综述进行补充,其中讨论了平台和分析工作流程,为首次接触植物scRNA-Seq的研究人员介绍了其中的关键因素,并提供了如何在早期阶段获得最有效的植物单细胞数据质量的建议。

解离实验的注意事项

我们知道,对scRNA-Seq数据质量影响最大的是前期实验环节的植物细胞悬液的制备。植物scRNA-Seq的流程中,研究者必须首先用酶消化法去除植物细胞壁,产生原生质体,因此优化这一过程是至关重要的。

作者的目标是找到一种在保持组织复杂性的同时,快速生成背景干净的细胞悬液的方法。具有不同细胞特征的植物组织应该设计一个量身定做的解离方案。细胞密度、细胞壁厚度、细胞壁组成以及角质层、木质素、栓质或类似化合物的存在,上述因素都会影响到组织消化效率,以及酶的选择和消化时间的选择。而其他细胞特性,诸如浮力(细胞下沉快慢会使细胞捕获复杂化)、对渗透压变化的敏感性(造成细胞爆裂)和细胞活性维持,也与能否成功进行细胞解离相关。适用于拟南芥根的各种方案表明,拟南芥是一个处理相对简单的组织。

然而,其他组织解离需要更进一步优化实验方案,最重要的是限制组织酶消化时间,理想情况下消化时间不应超过1小时,并将对基因表达的不利影响降至最低。适用于特定组织的细胞解离方案中还需要优化一系列因素,其中的关键因素包括酶浓度/组成、糖基选择(甘露醇、山梨醇、VS蔗糖)、缓冲液pH、培养温度和原生质体洗涤方法(离心和过滤)(图1)。考虑到许多组织不会很快完全解离,在解离之前需要对组织进行剪切、研磨或破碎,并在解离过程中进行物理搅拌,这对于得到组织内部细胞和保证细胞类型复杂性也是非常重要的。

图1 单细胞RNA测序(scRNA-Seq)原生质体分离的注意事项和技巧

对于先前建立的原生质体分离方案来说,任何一个因素都存在优化的可能性,以此提高高质量细胞悬液的分离效率。一些常用试剂或手段可能是多余或有问题的。例如,CaCl2会干扰RT,对于分离活细胞不是必需的。此外,一些研究提到了通过调整单一因素改善细胞恢复。例如,一项研究将增加甘露醇浓度与拟南芥叶片原生质体分离的改进联系在一起,而另一项研究提到L-半胱氨酸和山梨醇的预处理,会破坏玉米束鞘周围坚硬的松脂-木质素屏障。某些组织的蜡质表面可以用溶剂或洗涤剂来进行预处理,酶溶液的真空渗透也可以帮助处理更坚硬的植物组织。萨特利等人描述了通过向原生质体分离液中添加L-精氨酸并将pH从标准的5.7提高到7.5来显著提高分离的玉米分生组织细胞的细胞活力。

对于特定细胞的研究,研究者通常使用荧光分选(FACS)技术对特定类型的细胞进行富集。除此之外,Kim等人通过首先使用‘胶带夹心法’去除表皮细胞来丰富拟南芥叶片中的维管细胞数量。富集效果是通过对荧光显微镜来评估的,这种方法也可以用来评估稀有细胞类型和那些具有高度局部化反应的细胞的情况。

事实上,scRNA-Seq除了可以提供细胞类型的检测以外,还可以实现对植物的生物或非生物胁迫反应的探究。但是,随之而来的额外的问题,例如生物压力,细胞膨胀度通常会因病原体而改变。真菌和卵菌表达细胞壁松动酶,细菌感染同样会影响细胞壁的完整性。这将不可避免地影响原生质体的分离,而且这种影响在不同的细胞类型中似乎是不一致的。因此,研究病原体反应可能需要在病原体早期感染宿主的时间点进行研究,以减少由于前面提到的问题造成的单细胞实验难度通过scRNA-Seq研究应激反应还面临着其他问题,诸如原生质体分离的过程会触发转录反应,而这些反应可能很难与应激信号区分开来。与上面提到的捕获稀有细胞的检测方法类似,细胞的生存、代表性和状态可以通过处理含有特定荧光标记的反应基因或感兴趣细胞类型的标记的组织来进行评估。

解离方案的优化

除了制备植物单细胞悬液和解决应激反应之外,细胞解离方案产生的其他因素也可能会对最终的scRNA-Seq数据质量产生重大影响,因此需要对解离方案进行优化。

首先,在最终的细胞悬液中,最大限度地减少细胞破裂和细胞碎片是很重要的。其次,减少原生质体制备过程中产生的转录影响也是至关重要的,因为这会使下游分析变得复杂。第三,需要解决捕获和处理中的细胞大小偏好性的问题(图1)。虽然碎片本身不一定会显著影响数据的质量,但它可能会阻碍细胞量化(细胞计数)。此外,细胞破裂会导致样本中的游离RNA增加,这可能会导致批量效应,阻碍真正细胞的识别。完全清除碎片尽管很困难,但通过洗涤样本时加以低速离心可以有效地将细胞从细胞碎片中分离出来,并将细胞破裂降至最低。此外,使用被动式过滤器(细胞筛),而不是通常推荐的吸管-尖端过滤器,可以避免细胞大量破裂。尽管移液技术看似微不足道,但细微的变化也可能会对细胞产生重大的影响。其他方案,如选择添加流式细胞仪(FACS)分选这一步骤,能有效改善背景问题,尽管这可能会加剧细胞分离过程的转录偏好效应。

无法避免的是,除了碎片,在原生质体制备中也会出现松散的细胞核。这些细胞核对scRNA-Seq数据来说是有意义的,应该计入细胞计数中。通过DAPI染色可以用来估计最终细胞悬液中细胞核的数量。

应该最小化原生质体分离引起的转录影响,同时将其记录下来,在下游数据分析时加以解决。同时,尽量简化细胞解离方法固然重要,但对转录效应的影响最大的是解离时间。目前文献中使用的大多数方案都将解离时间减少到少于2小时,考虑到数据质量的影响,这似乎是一个宽泛的(有点武断)的时间范畴。在这种情况下,"修复"转录组以避免解离影响的方法仍有待充分探索。

除了将转录影响降到最低之外,识别在原生质体分离过程中诱导的基因也很重要。例如,WOX2在21%的拟南芥叶片原生质体中被检测到,而该基因在这里是不正常表达的。一般来说,同时进行bulk RNA-Seq实验,比较消化和未处理的组织,以确定在特定过程中诱导的基因似乎行之有效的方法。通过这种方法,在拟南芥根和玉米穗中分别鉴定了诱导2倍以上的3000个和713个基因。类似于这样的bulk RNA-Seq对照实验可以在scRNA-Seq实验之前进行。或者也可以参考以往的对原生质体分离诱导的基因的研究结论。同样,原生质体分离过程是否掩盖了人们感兴趣的应激反应,也可以通过对处理过的细胞悬液(原生质体)与未消化的组织进行bulk RNA-Seq实验分析来评估。原生质体分离诱导的基因最终是被保留还是被移除并用于下游分析,这取决于我们根据实际情况的判断。

事实上,在作者自己对拟南芥根的研究中,以及在几个迄今尚未发表的数据集中,发现保留或移除诱导基因对数据聚类或细胞分类能力几乎没有影响。然而,对于更复杂的分析,例如基因调控网络的推断,了解哪些基因是被诱导的是至关重要的。

在利用微流控技术时需要考虑的另一个因素是植物细胞通常较大且大小不一。例如,10x Genomics公司常用的Chromium platform限制细胞直径在40μm以下。尽管从使用该系统产生的各种数据集来看,似乎有成功捕获了大于“限制”的细胞,但显然存在明显的偏向较小的细胞。事实证明,不论采用更有针对性的组织分离方法,或者在检测中增加细胞数量,均很难避免这种系统偏差,更大的细胞是很难被捕获到的。另一种避免细胞大小限制的方法是从细胞核而不是整个细胞中产生scRNA-Seq文库。这在某些研究中已经被证明是成功的,但其效用有待与原生质体获得的数据进行比较。细胞核的分离可能会出现不同的转录组偏好效应。也可能会造成每个细胞的基因捕获量减少。但采用细胞核的方法更有利于处理难消化的组织和减少细胞的应激反应,这可是细胞核方法具有吸引力的地方。

目标细胞数量的确定

随着原生质体分离流程的优化,细胞计数、微流控平台捕获细胞和文库构建已经有了标准的方法,并严格遵循单细胞平台的方案协议。在这里,一个关键的问题是获取多少目标细胞的数量,以及如何确定加载到微流控芯片上的细胞数量。目标细胞的数量将主要取决于研究者感兴趣组织的复杂性、感兴趣细胞的比率,以及捕获效率等问题(图2)。在一个相对简单的组织中,如拟南芥根尖,少于10000个细胞足以捕获到样本内的稀有细胞。随着组织复杂性的增加或研究问题的复杂化,将需要更多的细胞数量。在近年植物单细胞的研究中发现,细胞数量急剧增加(表1)。

需要注意的是,scRNA-Seq平台在加载的细胞数量和实际最终拿到的高质量细胞是不一致的,后者要远低于加载的细胞量。这里面涉及到平台对细胞捕获效率的限制。例如,Chromium platform描述了每通道14000个细胞的加载能力,以及70%的加载细胞捕获率。然而,这主要还是基于对动物细胞的研究得出的结论。植物研究人员经常面临低得多的细胞捕获率,通常研究植物细胞得到的捕获效率在35%左右(个人交流,内部经验)。因此,需要提升更多细胞起始量来达到实际研究所需的细胞量。例如,试图通过加载更多的细胞来抵消低的回收率(平台的捕获效率),这一方案会存在超载或阻塞微流控芯片通道的风险,并且增加了后续数据的多细胞率,降低了数据质量。目前,细胞捕获率是scRNA-Seq应用于植物研究的主要不确定因素之一。

了解植物细胞的独特特性(如细胞大小不均一),以及平台对植物细胞的捕获效率,这些将会在后续开发平台性能上着重考虑的因素,以实现单细胞平台能够更加有效地应用于植物研究,这也是平台开发人员和科研研究人员所面临的挑战。对于植物单细胞研究所涉及到的技术重复或生物重复问题,目前该领域还没有一个明确的标准。然而,为了拿到更精细的细胞分类和完整的功能研究,增加技术重复或生物重复是非常有必要的。

测序量与细胞数量的平衡

ScRNA-Seq文库需要相当大的测序量才能获得数据的全貌。在不同的研究中,转录本UMI测量的深度和每个细胞检测到的基因差异很大(表1)。在不同的情况下,什么是必要的,什么是次要的,都是存在争议的。例如,10x Genomics建议每个细胞至少达到20k reads的测序量。该标准下的测序量通常适用于细胞类型的分类,但可能需要更高的测序饱和度才能更深入地比较和定义细胞群体内的异质性。在这里,每个细胞的测序深度和细胞数量之间实际上是存在内在的平衡。相同数据量的水平下,细胞越少,单个细胞的测序深度越高,这将比更多的细胞数量检测到的分子信息更加全面。几篇综述讨论了scRNA测序深度和分析结果之间的联系。Zhang等人从数学上解决了这个问题,他提出了一个最佳测序深度,即“每个基因大约在每个细胞中读取一次”。从动物研究中得出的许多关于测序深度的参数在植物中依然可能遵循,但有必要考虑到动植物细胞mRNA水平和捕获效率的差异、细胞异质性和植物细胞的特殊特性等问题。总体的要求(或者说标准)是测序总量能够满足捕获到的所有细胞内部的转录组检测。这可以通过将“批量的”scRNA-Seq数据与批量bulk RNA-Seq数据集进行比较来评估。在4727个细胞和每个细胞14758个UMI的情况下,90%的根的绝大多数转录组能被检测到(表1)。在这方面,对数据进行二次采样以评估测序饱和度也是一种有用的方法,也能够评估批次实验之间的重复性和复杂性信息。有趣的是,一些研究用低通量方法来补充论证高通量数据,如CelSeq-2和SmartSeq2。这些方法允许在更少的细胞上更深入地捕获mRNA,因此,可以对基于液滴的数据进行强有力的验证,并为高通量scRNA-Seq在低表达基因检测方面提供指导。采用这些微量的建库方法,实际上可以只需要采样一小部分细胞,而不需要数千个细胞,配以适当的测序深度即可探究整个组织的基因表达情况。

 图2 scRNA-Seq文库制备和测序的注意事项

与测序量多少的问题相关的是植物细胞捕获率的不可预测性。由于scRNA-Seq文库的复杂度很难通过非常有效的方式去识别,确认精确的测序数据量(已达到一定饱和度)是非常困难的。然而,这可以通过初步的浅层测序(试测少量数据量)来评估。例如,10x Genomics的Cell Ranger软件基于包含已观察到的UMI的部分读数来估计细胞数量并预测测序饱和度,在只进行很浅测序深度的植物文库上也是适用的(例如,5000万个reads,预期为7000个细胞,达到约7k reads/个细胞),从而对细胞数量以及文库的复杂性和质量提供了合理的评估。这尤其有利于消除在较差或不太理想的文库上进行过多、昂贵的测序量的风险。

除了前面描述的方法之外,还可以用多种方式评估文库的质量。例如,通过线粒体和叶绿体基因转录本捕获水平低,突出细胞破裂的发生可能性,这些都是衡量细胞悬液的有力指标。用定量的、对照的RNA转录物添加到测序文库,也可以在后续转录本分析时提供文库质量的指导。在整个异种细胞构建的文库中,判断是否存在多个尖峰可以进一步帮助评估文库/细胞复杂度。后续也可以使用Doublet Finder和Srublet等方法来评估和去除多细胞的问题(图2)。虽然目前已有一些植物scRNA-Seq标准的数据质量控制和分析方法,还还需要对特定组织制定给给个性化的实验分析方案,例如,更好地了解特定组织中植物细胞的mRNA含量,将有助于明确基于UMI的细胞cell-calling阈值,以达到更精准的细胞/非细胞数据的识别。

数据的分析和挖掘

ScRNA-Seq数据分析的初始目标是细胞聚类和细胞注释。数据通常流程为从主成分分析(PCA)导出的细胞cluster,并显示为相关性成分分布图(t-SNE或UMAP)。cluster中有丰富的基因表达信息,然而这些cluster的细胞类型暂时是无法确定的,还需要进一步去注释。目前已经开发了许多方法从标记基因或者先前的转录数据集中挖掘信息,例如细胞身份索引(ICI)方法。但是,即使有了细胞类型标记基因,还需要进行进一步的细胞分类,以实现对细胞亚型或者更罕见的细胞类型的发现。例如,拟南芥根的单细胞研究中,每个根只有大约4个QC细胞,很难定位。由于该类细胞的稀缺性,仅在QC细胞的一个子集中检测到良好的标记基因的表达。而且,像这样的基因有时可能在原生质体分离过程中被大量诱导应激基因所掩盖,并可能在QC以外的细胞中表达。因此,依靠单个或几个基因来注释稀有细胞类型必须谨慎,此外,细胞数量和测序深度对细胞分类都有很大的影响。

在缺乏标记基因信息的情况下,细胞类型鉴定可能更具挑战性。跨细胞簇的差异基因表达分析结合原位杂交分析是一种可靠的cluster鉴定方法。对于一些物种来说,采用注释良好的其他物种的标记基因的同源基因作为细胞鉴定的marker,将在很大程度上有助于解决非模式物种细胞鉴定的问题。除此之外,其他更具创造性的方法可能有助于实现细胞注释,例如,利用外部数据集与cluster的相关性为推断细胞身份提供线索。

ScRNA-Seq可以提供时空发育动力学、细胞亚型和状态,以及细胞对刺激和遗传扰动的反应等信息,这些都将在cluster中的基因表达上体现出来。来自发育中组织的细胞集群倾向于更像一个发育连续体,而不是具有共同特性的孤立的细胞群集(图3)。利用拟时序分析结合ICI等统计方法来产生和评估发育和分化轨迹,是单细胞数据的一个重要挖掘方向。拟时序相关分析有助于厘清来自复杂组织的数据,这些组织具有多个发育轴、复杂的反应途径、细胞状态分析和细胞周期动力学。例如,有多个不断发育的器官来自中心枢纽,每一个都有自己的细胞类型和发育动态,可以适用于这样的方法,而不仅仅是简单的差异基因表达分析和标记基因。

ScRNA-Seq数据在研究动态过程的应用上,如细胞状态转换和对胁迫的信号响应,通过拟时序分析根据相对基因表达的波动对细胞进行排序,以近似时间发育谱系的方式(图3),解决进化轨迹的程序。一旦建立了轨迹,就可以提取差异基因表达信息,并探索和比较特定细胞系的表达模式。然而,伴随着这种方法的实现,挑战也随之而来。例如,最为重要的是需要理解,无论输入什么数据,拟时序分析都会产生一个最终的“轨迹”。因此,为了产生真正可信的结果,可能需要额外的评估方法,例如基于标记基因表达,甚至在后续实验上系统地构建、解构和重建轨迹。

 图3 scRNA-Seq数据分析概述



结束语和未来展望

目前已经进行的许多植物单细胞研究证明了scRNA-Seq技术在植物领域的应用价值和潜力。了解原生质体制备过程的实验细节和注意事项,单细胞平台对植物细胞捕获偏差,如何平衡测序数据量和捕获细胞量,额外基因表达的影响,以及细胞鉴定和数据挖掘等方面的信息对科研者开展植物单细胞研究是至关重要的。

展望未来,单细胞技术应用于植物研究仍然存在一些常规问题。比如,植物样本制备过程中依然存在大量的问题,当前在动物细胞中应用的比较成熟的单细胞平台和分析工具对不同植物的适用性如何?如何评估植物单细胞数据质量?如何确定现有的一些标准化的关键参数对于植物单细胞数据是否适用?等等,这些问题将会随着时间的推移慢慢得到解决,这些答案也将会成为后续植物单细胞研究的标准!

参考文献:

[1] Denyer T, Timmermans MCP. Crafting a blueprint for single-cell RNA sequencing. Trends Plant Sci. 2022 Jan;27(1):92-103. doi: 10.1016/j.tplants.2021.08.016. Epub 2021 Sep 24. PMID: 34580023.



作者简介:罗晟 联川生物售前技术支持

在公司负责转录调控相关产品,如非编码RNA、m6A-seq、RIP-seq外泌体miRNA等



相关阅读
【用户文章】3D胶原基质调节骨髓造血祖细胞向巨噬细胞分化的转录轨迹 | 单细胞专题
谁说植物单细胞测序一定要原生质体?no!抽核一样能做!|单细胞专题
植物抽核案例:13分文章揭示拟南芥根系抽核单细胞研究优势│单细胞专题
植物单细胞原生质体难制备怎么办?植物抽核帮你忙 | 单细胞专题
用于植物单细胞核RNA测序的根细胞核分离方法 | 单细胞专题

点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存